Team:Maxplus

Inria | Raweb 2015 | Presentation of the Team Maxplus | Maxplus Web Site


	PDF	e-Pub

Previous |

Home | Next next

Section: New Results

Algorithmes/Algorithms

Algorithmique des polyèdres tropicaux/Algorithmics of tropical polyhedra

Participants : Xavier Allamigeon, Pascal Benchimol, Stéphane Gaubert, Michael Joswig [TU Berlin] .

Dans un travail de X. Allamigeon, P. Benchimol, S. Gaubert et M. Joswig [13] , nous avons défini un analogue tropical de l'algorithme du simplexe qui permet de résoudre les problèmes de programmation linéaire tropicale, i.e.

\begin{matrix} \begin{matrix} minimiser & max_{1 \leq j \leq n} c_{j} + x_{j} \\ sous les contraintes & max (max_{1 \leq j \leq n} (a_{i j}^{+} + x_{j}), b_{i}^{+}) \geq max (max_{1 \leq j \leq n} (a_{i j}^{-} + x_{j}), b_{i}^{-}), i = 1, \dots, m \\ x \in {(ℝ \cup {- \infty})}^{n} \end{matrix} \end{matrix}

(13)

où les entrées du programme $a_{i j}^{\pm}$ , $b_{i}^{\pm}$ , $c_{j}$ sont à valeur dans $ℝ \cup {- \infty}$ . Ces problèmes sont intimement liés à la résolution de jeux répétés à somme nulle, puisque résoudre un jeux à paiement moyen déterministe est équivalent à déterminer si un problème de programmation linéaire admet un point réalisable [44] .

Comme son homologue usuel, le simplexe tropical pivote entre des points de base (tropicaux), jusqu'à atteindre l'optimum du programme linéaire. La différence fondamentale avec l'algorithme du simplexe classique est que le pivotage est réalisé de manière purement combinatoire, en s'appuyant sur des descriptions locales du polyèdre tropical défini par les contraintes à l'aide d'(hyper)graphes orientés. Ceci nous a permis de prouver que l'étape de pivotage (incluant le calcul des coûts réduits) a la même complexité en temps que dans l'algorithme classique, i.e. $O (n (m + n))$ . Ceci est d'autant plus inattendu que la structure des arêtes tropicales entre deux points de base sont géométriquement plus complexes (elles sont constituées de plusieurs segments de droite, jusqu'à $n$ ).

Le simplexe tropical a la propriété d'être fortement corrélé avec l'algorithme du simplexe classique. Grâce au principe de Tarski, le simplexe usuel peut être transposé tel quel sur des programmes linéaires dont les coefficients en entrée sont non plus des réels, mais sur le corps $ℝ {{t}}$ des séries de Puiseux généralisées en une certaine indéterminée $t$ , i.e. des objets de la forme :

c_{α_{1}} t^{α_{1}} + c_{α_{2}} t^{α_{2}} + \dots

(14)

où les $α_{i}$ sont des réels, les coefficients $c_{α_{i}}$ sont des réels non-nuls, et où la séquence des $α_{1}, α_{2}, \dots$ est strictement croissante et soit finie, soit non-bornée. L'opposé du plus petit exposant de la série, $- α_{1}$ , est appelé valuation de la série. Un programme linéaire tropical est dit relevé en un problème linéaire sur $ℝ {{t}}$ , si la valuation des coefficients en entrée de ce dernier sont égaux aux coefficients du problème tropical. Dans nos travaux, nous avons établi la correspondance suivante entre le simplexe usuel et le simplexe tropical : pour tout programme linéaire tropical générique, l'algorithme du simplexe tropical trace l'image par la valuation du chemin sur l'algorithme du simplexe usuel sur n'importe quel relèvement du programme tropical dans $ℝ {{t}}$ .

Les résultats présentés ci-dessus sont rassemblés dans l'article [13] . Ils ont fait l'objet de plusieurs présentations en conférence [54] , [55] [59] .

Ces résultats ouvrent la possibilité de relier la complexité du l'algorithme du simplexe usuel avec celles des jeux déterministes. Pour ces derniers, on sait seulement que leur résolution est dans la classe de complexité $𝖭𝖯 \cap 𝖼𝗈𝖭𝖯$ , et on ignore s'il existe un algorithme de complexité polynomiale. De façon similaire, on ne sait pas caractériser de façon précise la complexité de l'algorithme du simplexe usuel. Celle-ci dépend fortement de la règle de pivotage utilisée, et il existe des problèmes sur lesquelles de nombreuses règles de pivotage ont une complexité exponentielle. L'existence d'une règle de pivotage qui permettrait au simplexe de terminer en temps polynomial sur n'importe quelle instance est encore aujourd'hui une question ouverte.

Dans un deuxième travail, nous avons relié les deux problèmes ouverts précédents, grâce à l'algorithme du simplexe tropical. Nous avons en effet exhibé une classe de règles de pivotage, dites combinatoires, et avons montré qu'elles satisfont la propriété suivante : s'il existe une règle de pivotage combinatoire qui permet de résoudre tout problème de programmation linéaire usuel en temps polynomial, alors on peut résoudre les jeux à paiement moyen en temps (fortement) polynomial. Le terme combinatoire fait référence au fait que la règle est définie en fonction du signe des mineurs de la matrice des coefficients du problème linéaire. Ce résultat est décrit dans l'article [56] , et a été présenté dans plusieurs conférences [57] , [58] .

Enfin, dans un travail de X. Allamigeon, P. Benchimol et S. Gaubert [53] , nous avons étendu les résultats aux règles de pivotage semi-algébriques, classe incluant la règle dite du shadow-vertex. Celle-ci est connue pour avoir fourni plusieurs bornes de complexité moyenne et lisse sur l'algorithme du simplexe. Nous avons donc tropicalisé l'algorithme du simplexe shadow-vertex, et nous avons montré que cet algorithme permet de résoudre les jeux à paiement moyen en temps polynomial en moyenne.

English version

In an ongoing work of X. Allamigeon, P. Benchimol, S. Gaubert and M. Joswig, we introduced a tropical analogue of the simplex algorithm, allowing one to solve problems of tropical linear programming, which are of the form (13 ), where the coefficients of the program, $a_{i j}^{\pm}$ , $b_{i}^{\pm}$ , $c_{j}$ take their values in the max-plus semiring $ℝ \cup {- \infty}$ . These problems are closely related to mean payoff games, as solving a game of this kind is equivalent to determine whether a tropical linear program admits a feasible point [44] .

Like the classical simplex algorithm, the tropical simplex algorithm performs pivoting operations between basis points, until it reaches the optimum. The main discrepancy with the classical algorithm is that the pivoting is now a purely combinatorial operation, which is performed by using a local description of the polyhedron by a directed hypergraph. This allowed us to show that a tropical pivoting step (including computing reduced costs) has the same complexity as in the classical simplex algorithm, i.e. $O (n (m + n))$ . This is all the more surprising as the tropical edge between two given points has a geometrically more complex structure in the tropical case (it is constituted of up to $n$ ordinary line segments).

The tropical simplex algorithm turns out to be closely related to the classical one. Thanks to Tarski's principle, the latter is also valid for linear programs over the field $ℝ {{t}}$ of generalized Puiseux series in an indeterminate $t$ . These series are of the form (14 ), where the $α_{i}$ are real numbers, the coefficients $c_{α_{i}}$ are non-zero reals, and the sequence $α_{1}, α_{2}, \dots$ is strictly increasing and either finite or unbounded. The opposite of the smallest exponent of the series, $- α_{1}$ , is called valuation. A tropical linear program is said to be lifted to a linear program over $ℝ {{t}}$ if the valuation of the coefficients of the latter are sent to the coefficients of the former by the valuation. We showed the following relation between the classical simplex algorithm and its tropical analogue: for all generic tropical linear program, the tropical simplex algorithm computes the image by the valuation of the path of the classical simplex algorithm, applied to any lift in $ℝ {{t}}$ of the original program.

These results are gathered in the article [13] . They have been presented in several conferences [54] , [55] [59] .

They allow one to relate the complexity of the classical simplex algorithm with the complexity of mean payoff games. The latter is unsettled, these games are known to be in the class $𝖭𝖯 \cap 𝖼𝗈𝖭𝖯$ but it is not known whether they can be solved in polynomial time. Basic complexity issues regarding the classical simplex algorithm are also unsettled: its execution time depends on the pivoting rule, and many pivoting rules have been shown to have exponential worst case behaviors. The existence of a pivoting rule leading the simplex to terminate in polynomial time is still an open question. . In a second work, we related these two open questions, via the tropical simplex algorithm. We identified a class of pivoting rules, which are said to be combinatorial, and show that they have the following property: if there is a combinatorial pivoting rule allowing one to solve every classical linear programming problem in polynomial time, then, mean payoff games can be solved in (strongly) polynomial time. By combinatorial, we mean that the rule depends only of the coefficients of the system through the signs of minors of the coefficients matrix. This result is given in the article [56] . It has been presented to the conferences [57] , [58] .

Finally, in a work of X. Allamigeon, P. Benchimol and S. Gaubert [53] , we extended the latter results to semi-algebraic pivoting rules, which include the so-called shadow-vertex rule. This rule has been exploited in the literature to establish several average-case and smooth complexity bounds on the simplex algorithm. We tropicalized the shadow-vertex simplex algorithm, and showed that it solves mean payoff games in polynomial time on average.

Approximation max-plus de fonctions valeurs et équations de Riccati généralisées/Max-plus approximation of value functions and generalized Riccati equations

Participants : Stéphane Gaubert, Zheng Qu, Srinivas Sridharan.

Le travail de thèse de Zheng Qu, supervisée par S. Gaubert et S. Tang, a porté sur le développement de méthodes tropicales en programmation dynamique approchée [154] . Celle-ci permettent d'attenuer la malédiction de la dimension, pour certaines classes de problèmes de contrôle optimal.

Un développement de ce travail est paru dans [17] , où il est montré qu'une classe de relaxations convexes introduites par Sridharan et al. pour traiter numériquement un problème de contrôle quantique sont en fait exactes (pas de saut de relaxation).

English version

The PhD work of Zheng Qu, supervised by S. Gaubert and S. Tang, dealt with the développement of tropical methods in approximate dynamic programming [154] . These allow one to attenuate the curse of dimensionality for certain optimal control problems.

A development of this work appeared in [17] . It is shown there that a class of convex relaxations introduced Sridharan et al. to solve numerically some quantum control problem is exact.

Approximation probabiliste d'équations d'Hamilton-Jacobi-Bellman et itération sur les politiques

Participants : Marianne Akian, Eric Fodjo.

La thèse d'Eric Fodjo traite de problèmes de contrôle stochastique (de diffusions) issus en particulier de problèmes de gestion de portefeuille avec coûts de transaction. La programmation dynamique conduit à une équation aux dérivées partielles d'Hamilton-Jacobi-Bellman, sur un espace de dimension au moins égale au nombre d'actifs risqués. La malédiction de la dimension ne permet pas de traiter numériquement ces équations en dimension grande (supérieure à 5). On se propose d'aborder ces problèmes avec des méthodes numériques associant itération sur les politiques, discrétisations probabilistes, et discrétisations max-plus, afin d'essayer de monter plus en dimension. Une autre piste est de remplacer l'itération sur les politiques par une approximation par des problèmes avec commutations optimales.

Nous considérons actuellement des équations d'Hamilton-Jacobi-Bellman fortement non-linéaires associées à des problèmes de contrôle de diffusions faisant intervenir un contrôle discret (prenant un nombre fini de valeurs) et éventuellement un contrôle continu. On construit un algorithme numérique probabiliste de faible complexité, en combinant les propriétés de distributivité idempotente obtenues par McEneaney, Kaise et Han [128] , [145] pour le même type d'équations et la méthode numérique probabiliste proposée par Fahim, Touzi et Warin [104] pour résoudre des équations d'Hamilton-Jacobi-Bellman fortement non-linéaires, lorsque la volatilité ne varie pas trop.

English version

The PhD thesis of Eric Fodjo concerns stochastic control problems obtained in particular in the modelisation of portfolio selection with transaction costs. The dynamic programming method leads to a Hamilton-Jacobi-Bellman partial differential equation, on a space with a dimension at least equal to the number of risky assets. Curse of dimensionality does not allow one to solve numerically these equations for a large dimension (greater to 5). We propose to tackle these problems with numerical methods combining policy iterations, probabilistic discretisations, max-plus discretisations, in order to increase the possible dimension. Another solution is to replace policy iterations by an approximation with optimal switching problems.

Our current work concerns fully nonlinear Hamilton-Jacobi-Bellman equations associated to diffusion control problems with finite horizon involving a finite set-valued (or switching) control and possibly a continuum-valued control. We construct a lower complexity probabilistic numerical algorithm by combining the idempotent expansion properties obtained by McEneaney, Kaise and Han [128] , [145] for solving such problems with a numerical probabilistic method such as the one proposed by Fahim, Touzi and Warin [104] for solving some fully nonlinear parabolic partial differential equations, when the volatility does not oscillate too much.

Previous |

Home | Next next